argre框架

ARGRE框架实现高效LLM解毒：自回归奖励引导，安全对齐更快、更准

ARGRE框架实现高效LLM解毒：自回归奖励引导，安全对齐更快、更准

作者为北京航空航天大学的肖宜松，刘艾杉，应宗浩，刘祥龙，新加坡国立大学的梁思源，新加坡南洋理工大学的陶大程。本文已被 NeurIPS 2025 录用。

llm 解毒 argre llm解毒 argre框架 2025-10-27 20:18 18

ARGRE框架实现LLM解毒：自回归奖励引导，安全对齐更快、更准

ARGRE框架实现LLM解毒：自回归奖励引导，安全对齐更快、更准

作者为北京航空航天大学的肖宜松，刘艾杉，应宗浩，刘祥龙，新加坡国立大学的梁思源，新加坡南洋理工大学的陶大程。本文已被 NeurIPS 2025 录用。

llm 解毒 argre llm解毒 argre框架 2025-10-27 18:38 18